神级程序员Fabrice Bellard发布音频压缩工具TSAC:底层采用Transformer模型、算力要求高
下面感受一波 TSAC 的压缩效果:
original(原始音频)
stereo 7.26 kb/s(立体声)
mono 5.61 kb/s(单声道)
stereo 2.99 kb/s(立体声)
Fabrice Bellard 表示,TSAC 基于针对立体声扩展的 Descript Audio Codec 的修改版本和 Transformer 模型,以进一步提高压缩比。两种模型均量化为每个参数 8 位。
由于 TSAC 需要大量的计算能力,如果希望快速运行推荐使用英伟达 GPU,当然也支持 CPU,但速度较慢。
Fabrice Bellard 是法国计算机程序员,以编写FFmpeg,QEMU和Tiny C编译器而闻名。他开发了Bellard公式来计算pi的位数。2012年,贝拉德(Bellard)与弗兰克·斯皮内利(Franck Spinelli)共同创立了一家电信公司Amarisoft。
1972年出生,17岁创建了可执行的压缩器LZEXE。
1996年他编写了一个简洁但是完整的C编译器和一个Java虚拟机Harissa。
1997年,他发现了一个新的,更快的公式计算pi的位数。
1998年编写了一个简洁的OpenGL实现TinyGL。
2000年开发FFMPEG。
2002年,他开发了TinyGL,这是适用于嵌入式环境的OpenGL的子集。
2003年开发了Emacs克隆QEmacs。
2003年发明QEMU 通用机器仿真器和虚拟器。
2004年,他编写了TinyCC引导加载程序,该加载程序可以在15秒内从源代码编译并引导Linux内核。
2005年,他设计了一种系统,该系统可以通过直接从标准PC和VGA卡生成VHF信号来充当模拟或DVB-T数字电视发射机。
2011年,他创建了一个用纯JavaScript编写的最小PC模拟器。该仿真硬件包括一个32位x86兼容CPU,一个8259可编程中断控制器,一个8254可编程中断定时器和一个16450 UART。
2009年,他在计算pi的过程中创下了世界纪录,在90天内将其计算为将近2.7万亿个位。Slashdot写道:“虽然改进似乎很小,但它是一项了不起的成就,因为只使用了价格低于3,000美元的一台台式机,而不是以前记录中的数百万美元的超级计算机。
2011年,他获得了O'Reilly开源奖。
2014年,他提出了更好的便携式图形(BPG)图像格式,以替代JPEG。
2019年7月,他发布了QuickJS,这是一个小型且可嵌入的Javascript引擎。
最后再看看让众人膜拜的 Fabrice Bellard 个人主页:
https://bellard.org/
相关链接
https://bellard.org/tsac/
https://hydrogenaud.io/index.php/topic,125765
热门文章
- 某开源公司实习生上班时间向其他开源项目提交PR,CEO发现后要求关闭
⬇️ 长按二维码,启动!